Ngram相关论文
针对现有恶意域名检测方法存在检测精度不高和检测范围局限等问题,提出一种基于Ngram+Bi-GRU的多家族恶意域名检测算法.首先,利用N......
候选关键词组鉴别是关键词组自动化提取的第一步,在这个过程中采用了一种新的数据结构:双向型高搭配力度ngram链.这种链式结构以搭......
本文在统计语言模型构造中,提出了将词间距离信息结合到N-gram统计语言模型中的思路,并称之为距离加权的关联词统计语言模型.该模......
本文提出的无词典分词方法,仅依靠未标注语料里面包含的统计信息进行分词。这个方法分为两步:第一步通过统计得到NGram的统计信息;第......
把基于统计的语料概率统计方法与基于规则的自然语言理解方法结合起来,提出了一种新的汉语计算语言模型,并把该模型应用于语音识别后......
提出了一种语句级汉字输入技术,把N-gram统计语言模型与语言规则结合起来共同指导拼音流到文字流的转换过程。描述了拼音流自动切分、词网......
针对汉语语言模型中知识获取不足的问题,提出了一种统计与多种形式规则信息结合的机制,将规则的表示量化,提出语法语义规则矩阵的......
候选关键词组鉴别是关键词组自动化提取的第一步,在这个过程中我们采用了一种新的数据结构:双向型高搭配力度ngrarn链。这种链式结构......
候选关键词组鉴别是关键词组自动化提取的第一步,在这个过程中采用了一种新的数据结构:双向型高搭配力度ngram链.这种链式结构以搭......
本文提出并实现了一种大规模汉语语料库中字、词级任意n的n-gram统计算法,本算法可以一次性统计出所有不大于任意n(本文n取为256)的字、词级n-gram,可将传......
常用词搭配(collocation)是指一些常用的用来表达某些事情或事物的短语,一般是二元组或三元组等.常用词搭配的自动发现在自然语言......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......
本文研究了N元文法(N gram)统计语言模型中的4种插值平滑算法,在中文语言模型中进行了应用,从语言模型复杂度的角度比较了该4种方......
候选关键词组鉴别是关键词组自动化提取的第一步,在这个过程中采用一种新的数据结构:双向型高搭配力度ngram链。这种链式结构以搭配......